句法|研究者_伯克利摘得最佳论文|ACL2022奖项公布

作者：小样2502857665 | 来源：互联网 | 2023-09-17 13:31

篇首语：本文由编程笔记#小编为大家整理，主要介绍了伯克利摘得最佳论文|ACL2022奖项公布相关的知识，希望对你有一定的参考价值。点击机器学习算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了伯克利摘得最佳论文 | ACL2022奖项公布相关的知识，希望对你有一定的参考价值。

点击 机器学习算法与Python学习 &＃xff0c;选择加星标

精彩内容不迷路

机器之心报道

刚刚&＃xff0c;NLP 领域国际顶会 ACL2022 公布获奖论文信息&＃xff0c;其中加州大学伯克利分校的增量句法表示研究被评为最佳论文。此外&＃xff0c;最佳主题论文、杰出论文也揭晓。

ACL 是计算语言学和自然语言处理领域的顶级国际会议&＃xff0c;由国际计算语言学协会组织&＃xff0c;每年举办一次。一直以来&＃xff0c;ACL 在 NLP 领域的学术影响力都位列第一&＃xff0c;它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 60 届&＃xff0c;将于 5 月 22-5 月 27 在爱尔兰都柏林举办。

2 月 24 日&＃xff0c;ACL 2022 录用结果公布。本届大会主会议共接收了 604 篇长论文和 97 篇短论文&＃xff08;以 ACL 2022 公布的论文列表查询为准&＃xff09;。

刚刚&＃xff0c;大会官方公布了最佳论文、最佳主题论文、杰出论文以及最佳资源论文和最佳语言洞察力论文。其中&＃xff0c;加州大学伯克利分校的获得最佳论文奖&＃xff0c;加拿大国家研究委员会、爱丁堡大学等机构的研究者获得最佳主题论文奖。此外&＃xff0c;多位华人学者参与的研究被评为杰出论文&＃xff0c;包括陈丹琦、杨笛一等的研究。

最佳论文

ACL 2022 的最佳论文&＃xff08;Best Paper&＃xff09;来自加州大学伯克利分校研究团队&＃xff0c;该研究提出了一种增量句法表示&＃xff0c;与当前的 SOTA 解析模型相当。

题目&＃xff1a;Learned Incremental Representations for Parsing
作者&＃xff1a;Nikita Kitaev, Thomas Lu 、Dan Klein
机构&＃xff1a;加州大学伯克利分校
链接&＃xff1a;https://aclanthology.org/2022.acl-long.220.pdf

摘要&＃xff1a;该研究提出了一种增量句法表示&＃xff0c;该表示包括为句子中的每个单词分配一个离散标签&＃xff0c;其中标签是使用句子前缀的严格增量处理来预测的&＃xff0c;并且句子标签序列完全确定了解析树。该研究旨在诱导一种句法表示&＃xff0c;它只在句法选择由输入逐渐显示时才确定这些选择&＃xff0c;这与标准表示形成鲜明对比&＃xff0c;标准表示必须进行输出选择&＃xff0c;例如推测性的附件&＃xff0c;然后抛出相互冲突的分析。

该研究学习的表示在 Penn Treebank 上达到了 93.72 F1&＃xff0c;且每个单词只有 5 bit&＃xff1b;在每个单词为 8 bit 时&＃xff0c;该研究在 Penn Treebank 上达到了 94.97 F1&＃xff0c;这和使用相同的预训练嵌入时的 SOTA 解析模型相当。该研究还对系统学习到的表示进行了分析&＃xff0c;他们研究了系统捕获的可解释句法特征等属性&＃xff0c;以及句法歧义的延迟解决机制。

最佳主题论文

今年的最佳主题论文&＃xff08;Best Special Theme Paper &＃xff09;研究来自加拿大国家研究委员会、爱丁堡大学、皇后大学等机构研究者&＃xff0c;他们主要研究为低资源语音合成相关技术。

标题&＃xff1a;Requirements and Motivations of Low-Resource Speech Synthesis for Language Revitalization
作者&＃xff1a;Aidan Pine, Dan Wells, Nathan Brinklow, Patrick William Littell 、Korin Richmond
机构&＃xff1a;加拿大国家研究委员会、爱丁堡大学、皇后大学
链接&＃xff1a;https://aclanthology.org/2022.acl-long.507.pdf

摘要&＃xff1a;该研究阐述了语音合成系统的发展动机和目的&＃xff0c;以振兴语言。通过为加拿大使用的三种土著语言 (Kanien &＃39;kéha, Gitksan 和 SENĆOŦEN) 构建语音合成系统&＃xff0c;该研究重新评估了需要多少数据才能构建具有 SOTA 性能的低资源语音合成系统。例如&＃xff0c;该研究在英语数据的初步结果表明&＃xff0c;在训练数据上训练 1 小时的 FastSpeech2 模型可以产生与训练 10 小时的 Tacotron2 模型语音自然度相当。最后&＃xff0c;该研究们鼓励在语音合成领域进行评估和课堂整合来进行未来研究&＃xff0c;以实现语言复兴。

八篇杰出论文

本届会议还评出了八篇杰出论文&＃xff08;Outstanding Papers&＃xff09;&＃xff0c;佐治亚理工学院交互计算学院助理教授杨笛一&＃xff08;Diyi Yang&＃xff09;、普林斯顿大学计算机科学系助理教授陈丹琦等人的研究在列。

论文 1&＃xff1a;Evaluating Factuality in Text Simplification

作者&＃xff1a;Ashwin Devaraj、William Berkeley Sheffield、Byron C Wallace、Junyi Jessy Li
机构&＃xff1a;德克萨斯大学奥斯汀分校、东北大学
论文地址&＃xff1a;https://arxiv.org/pdf/2204.07562.pdf

摘要&＃xff1a;自动简化模型旨在使输入文本更具可读性&＃xff0c;但此类模型会在自动简化的文本中引入错误。因此&＃xff0c;研究者提出了一种错误分类法&＃xff0c;用来分析从标准简化数据集和 SOTA 模型输出中提出的参考资料。

论文 2&＃xff1a;Online Semantic Parsing for Latency Reduction in Task-Oriented Dialogue

作者&＃xff1a;Jiawei Zhou、Jason Eisner、Michael Newman、Emmanouil Antonios Platanios、Sam Thomson
机构&＃xff1a;哈佛大学、微软
论文地址&＃xff1a;https://aclanthology.org/2022.acl-long.110.pdf

摘要&＃xff1a;标准对话语义解析将完整的用户话语映射到可执行程序中&＃xff0c;然后执行该程序以响应用户&＃xff0c;速度可能很慢。研究者过在用户仍在说话时预测和执行函数调用来减少延迟的机会&＃xff0c;并引入了在线语义解析任务&＃xff0c;采用受同步机器翻译启发的规范延迟减少指标。此外&＃xff0c;他们还提出了一个通用框架。

论文 3&＃xff1a;Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation

作者&＃xff1a;Xiangpeng Wei、Heng Yu、Yue Hu、Rongxiang Weng、Weihua Luo、Rong Jin
机构&＃xff1a;阿里达摩院、中科院信息工程研究所、中国科学院大学
论文地址&＃xff1a;https://arxiv.org/pdf/2204.06812v1.pdf

摘要&＃xff1a;监督神经机器翻译&＃xff08;NMT&＃xff09;的主要任务是学习生成以来自一组并行句子对的源输入为条件的目标句子&＃xff0c;从而得到一个能够泛化到未见过实例的模型。然而&＃xff0c;通常观察到模型的泛化性能很大程度上受训练中使用的并行数据量的影响。研究者提出了一种新的数据增强范式&＃xff0c;称之为连续语义增强&＃xff08;Continuous Semantic Augmentation, CsaNMT&＃xff09;&＃xff0c;它为每个训练实例增加了一个邻接语义区域。

论文 4&＃xff1a;Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitivity

作者&＃xff1a;Yao Lu、Max Bartolo、Alastair Moore、Sebastian Riedel、Pontus Stenetorp
机构&＃xff1a;伦敦大学学院、Mishcon de Reya LLP
论文地址&＃xff1a;https://arxiv.org/pdf/2104.08786v2.pdf

摘要&＃xff1a;当仅使用少量训练样本启动时&＃xff0c;与完全监督、微调、大型、预训练的语言模型相比&＃xff0c;GPT-3 等超大预训练语言模型展现出具有竞争力的结果。研究者证明了提供样本的顺序可以在接近 SOTA 和随机猜测性能之间产生差异&＃xff1a;本质上&＃xff0c;一些排列很棒&＃xff0c;而另一些则不是。他们分析了这一现象&＃xff0c;分析它存在于模型大小方面&＃xff0c;与特定的样本子集无关&＃xff0c;并且一个模型的给定良好排列不能转移到另一个模型。

因此&＃xff0c;研究者利用语言模型的生成特性来构建一个人工开发集&＃xff0c;并基于该集上候选排列的熵统计确定性能提示。他们的方法在 11 个不同的已建立文本分类任务中为 GPT 系列模型产生了 13% 的相对改进。

论文 5&＃xff1a;Inducing Positive Perspectives with Text Reframing

作者&＃xff1a;Caleb Ziems、Minzhi Li、Anthony Zhang、Diyi Yang
机构&＃xff1a;佐治亚理工学院、新加坡国立大学
论文地址&＃xff1a;https://arxiv.org/pdf/2204.02952v1.pdf

摘要&＃xff1a;该研究引入了积极重构任务&＃xff0c;在该任务中&＃xff0c;该研究消除消极观点并为作者生成更积极的观点&＃xff0c;而不会与原始含义相矛盾。为了促进快速进展&＃xff0c;该研究引入了一个大规模的基准&＃xff0c;积极心理学框架&＃xff08;POSITIVE PSYCHOLOGY FRAMES&＃xff09;&＃xff0c;其具有 8349 个句子对和 12755 个结构化注释&＃xff0c;以根据六种理论动机的重构策略来解释积极重构。

在四位作者中&＃xff0c;杨笛一&＃xff08;Diyi Yang&＃xff09;是佐治亚理工学院交互计算学院助理教授。

论文 6&＃xff1a;Ditch the Gold Standard: Re-evaluating Conversational Question Answering

作者&＃xff1a;Huihan Li、高天宇、Manan Goenka、陈丹琦
机构&＃xff1a;普林斯顿大学
论文地址&＃xff1a;https://arxiv.org/pdf/2112.08812v2.pdf

摘要&＃xff1a;在这项工作中&＃xff0c;该研究对 SOTA 对话式 QA 系统进行了首次大规模的人类评估&＃xff0c;其中人类评估员与模型进行对话&＃xff0c;并判断其答案的正确性。该研究发现人机&＃xff08;humanmachine&＃xff09;对话的分布与人 - 人&＃xff08;human-human &＃xff09;对话的分布有很大的不同&＃xff0c;在模型排名方面&＃xff0c;人类评估和黄金历史&＃xff08;goldhistory&＃xff09;评估存在分歧。该研究进一步研究了如何改进自动评估&＃xff0c;并提出了一种基于预测历史的问题重写机制&＃xff0c;该机制可以与人类判断更好地关联。最后&＃xff0c;该研究分析了各种建模策略的影响&＃xff0c;并讨论了构建更好的对话式问答系统的未来方向。

论文作者之一为普林斯顿大学博士二年级学生高天宇&＃xff0c;师从该校计算机科学系助理教授陈丹琦。

论文 7&＃xff1a;Active Evaluation: Efficient NLG Evaluation with Few Pairwise Comparisons

作者&＃xff1a;Akash Kumar Mohankumar、Mitesh M Khapra
机构&＃xff1a;微软、印度理工学院马德拉斯分校
论文地址&＃xff1a;https://arxiv.org/pdf/2203.06063v2.pdf

摘要&＃xff1a;在这项工作中&＃xff0c;该研究引入了主动评估&＃xff0c;在 13 个 NLG 评估数据集上使用 13 个 dueling bandits 算法进行了广泛的实验&＃xff0c;涵盖 5 个任务&＃xff0c;实验表明人工注释的数量可以减少 80%。为了进一步减少人工注释的数量&＃xff0c;该研究提出了基于模型的 dueling bandit 算法&＃xff0c;该算法将自动评估指标与人工评估相结合&＃xff0c;这将所需的人工注释数量进一步减少了 89%。

论文 8&＃xff1a;Compression of Generative Pre-trained Language Models via Quantization

作者&＃xff1a;Chaofan Tao、Lu Hou、Wei Zhang、Lifeng Shang、Xin Jiang、Qun Liu、Ping Luo、Ngai Wong
机构&＃xff1a;香港大学、华为诺亚实验室
论文地址&＃xff1a;https://arxiv.org/pdf/2203.10705v1.pdf

摘要&＃xff1a;本文采用量化方法对生成式 PLM&＃xff08;Pre-trained Language Models&＃xff09;进行压缩。他们提出了一种 token 级的对比蒸馏方法来学习可区分的词嵌入&＃xff0c;此外&＃xff0c;该研究还提出了一种模块级的动态扩展来使量化器适应不同的模块。在各种任务的经验结果表明&＃xff0c;该研究提出的方法在生成 PLM 上明显优于 SOTA 压缩方法。在 GPT-2 和 BART 上分别实现了 14.4 倍和 13.4 倍的压缩率。

参考链接&＃xff1a;

https://www.2022.aclweb.org/papers

https://www.2022.aclweb.org/best-paper-awards

觉得不错&＃xff0c;请点个在看呀

推荐阅读

get
[编程题] LeetCode上的Dynamic Programming(动态规划)类型的题目

继上次把backTracking的题目做了一下之后：backTracking，我把LeetCode的动态规划的题目又做了一下，还有几道比较难的Medium的题和Hard的题没做出来，后面会继续 ... [详细]

蜡笔小新 2024-11-26 14:31:10
string
深入解析轻量级数据库 SQL Server Express LocalDB

本文详细介绍了 SQL Server Express LocalDB，这是一种轻量级的本地 T-SQL 数据库解决方案，特别适合开发环境使用。文章还探讨了 LocalDB 与其他轻量级数据库的对比，并提供了安装和连接 LocalDB 的步骤。 ... [详细]

蜡笔小新 2024-11-25 20:36:01
get
Nagios可视化插件开发指南 —— 配置详解

本文详细介绍了Nagios监控系统的配置过程，包括数据库的选择与安装、Nagios插件的安装及配置文件的解析。同时，针对常见的配置错误提供了具体的解决方法。 ... [详细]

蜡笔小新 2024-11-26 16:13:46
get
基于Workman的PHP即时通讯系统：支持单聊、群聊、视频会议及实时音视频功能

本文介绍了如何使用Workman框架构建一个功能全面的即时通讯系统，该系统不仅支持一对一聊天、群组聊天，还集成了视频会议和实时音视频通话功能，同时提供了红包发送等附加功能。 ... [详细]

蜡笔小新 2024-11-26 15:42:43
const
Codeforces 580C：Kefa与公园的路径选择问题

本文探讨了Codeforces 580C题目——Kefa与公园的问题，深入分析了如何在给定条件下帮助Kefa找到合适的餐厅。 ... [详细]

蜡笔小新 2024-11-26 13:50:23
const
二进制数组构建与遍历二叉树

本文探讨了如何利用数组来构建二叉树，并介绍了通过队列实现的二叉树层次遍历方法。通过具体的C++代码示例，详细说明了构建及打印二叉树的过程。 ... [详细]

蜡笔小新 2024-11-25 19:31:10
get
华为云openEuler环境下的Web应用部署实践

本文详细记录了在华为云openEuler系统上进行Web应用部署的具体步骤，包括配置yum源、安装Apache、MariaDB、PHP及其相关组件，并完成WordPress的安装与配置过程。 ... [详细]

蜡笔小新 2024-11-25 12:39:31
js
Java毕业设计：在线办公工作流系统MyBatis+源码+调试部署+数据库+论文

本文介绍了基于Java的在线办公工作流系统的毕业设计方案，涵盖了MyBatis框架的应用、源代码分析、调试与部署流程、数据库设计以及相关论文撰写指导。 ... [详细]

蜡笔小新 2024-11-25 10:21:47
get
Java高级工程师学习路径及面试准备指南

本文基于一位朋友的PDF面试经验整理，涵盖了Java高级工程师所需掌握的核心知识点，包括数据结构与算法、计算机网络、数据库、操作系统等多个方面，并提供了详细的参考资料和学习建议。 ... [详细]

蜡笔小新 2024-11-24 10:12:21
get
Docker基础入门与环境配置指南

本文介绍了Docker——一款用Go语言编写的开源应用程序容器引擎。通过Docker，用户能够将应用及其依赖打包进容器内，实现高效、轻量级的虚拟化。容器之间采用沙箱机制，确保彼此隔离且资源消耗低。 ... [详细]

蜡笔小新 2024-11-24 09:54:53
md5
在CentOS 7中部署Nginx并配置SSL证书

本文详细介绍了如何在CentOS 7操作系统上安装Nginx服务器，并配置SSL证书以增强网站的安全性。适合初学者和中级用户参考。 ... [详细]

蜡笔小新 2024-11-24 02:18:19
js
41款高效LISP工具助力数据处理全流程

本文由公众号【数智物语】(ID: decision_engine)发布，关注获取更多干货。文章探讨了从数据收集到清洗、建模及可视化的全过程，介绍了41款实用工具，旨在帮助数据科学家和分析师提升工作效率。 ... [详细]

蜡笔小新 2024-11-24 00:11:50
join
MySQL 高级特性深度解析

本文深入探讨了MySQL中的高级特性，包括索引机制、锁的使用及管理、以及如何利用慢查询日志优化性能。适合有一定MySQL基础的读者进一步提升技能。 ... [详细]

蜡笔小新 2024-11-23 22:01:49
join
初探Hadoop：第一章概览

本文深入探讨了《Hadoop》第一章的内容，重点介绍了Hadoop的基本概念及其如何解决大数据处理中的关键挑战。 ... [详细]

蜡笔小新 2024-11-24 11:40:47
schema
详解Linux命令：mysqlshow的使用方法

本文详细介绍了如何使用Linux下的mysqlshow命令来查询MySQL数据库的相关信息，包括数据库、表以及字段的详情。通过本文的学习，读者可以掌握mysqlshow命令的基本语法及其常用选项。 ... [详细]

蜡笔小新 2024-11-24 11:25:08

小样2502857665

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章